dskjal

Waifu Diffusion で効率的に画像を生成する

カテゴリ:deeplearning

目次

ワークフロー

Waifu Diffusion (Stable Diffusion)はプロンプトで細部の指示はできない。Waifu Diffusion で大まかな方向性の画像を作り、細部は img2img を使って修正したり、フォトバッシュするのが効率的だ。

1. プロンプトの調査

作成したい画像に近いイメージの画像を Deep Danbooru に入れてタグを調べる。もしくはどこかからプロンプトを拾ってくる

AUTOMATIC1111 ならローカルで Deep Danbooru が使える

2. プロンプトを修正して画像を生成

3. 細部を手で修正

手元の画像と似た画像を生成したい場合

Control Net の Reference Only を使う

補正

Automatic1111 の Extension の After DetailerDotgeo(hijack) Detection Detailer は顔を検出して顔を加筆する。

顔に影が入るモデルには レフ版 LoRA が便利。

Drooping Eyes :TAREME [Tools] の LoRA を使うとツリ目を補正できる。

After Detailer の例

After Detailer のプロンプトにのみ highly detailed eyes, glowing eyes, simple highlight を入れる方法がある。

元解像度: 768 x 1024<br/>After Detailer の解像度:1024 x 1024<br/>プロンプト:1girl close up in the classroom<br/>ネガティブ:realistic, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry<br/>After Detailer のプロンプト:highly detailed eye, highly detailed face

元解像度: 768 x 1024
After Detailer の解像度:1024 x 1024
プロンプト:1girl close up in the classroom
ネガティブ:realistic, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
After Detailer のプロンプト:highly detailed eye, highly detailed face

書き込み量

Automatic1111 の Extension の CD(Color/Detail) Tuner は背景の書き込み量を調整できる。

LoRA の detail-tweaker-lora を使う方法もある。ウェイトを -1 にすると画面がシンプルになる。

便利なツール

rembg

AI で背景を透過するツール。

txt2mask

テキストを使ってマスク部分を指定できるツール。

より詳細な解説

絵下手マンがWaifu Diffusionでファンアートを描く方法

続・絵下手マンがWaifu Diffusionでファンアートを描く方法 加筆ノウハウ編

より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion]

【全体公開】今から追いつく!AIイラスト超入門

AI画像生成を利用した着色高速化ワークフロー[NovelAI]

ぶるぺん流AIイラスト生成術

新機能『Depth to image』でベース画像の形状を維持したまま画像生成

実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる

アニメ

AIと3D利用したアニメ制作 統一性のある背景を様々なアングルから生成

AIを活用して簡単なアニメーションを作る方法!一貫性を保ちつつ手軽にキャラクターを動かそう【ControlNet活用術】

差分生成の実例

AUTOMATIC1111 の Prompt S/R を使う方法

プロンプトを切り替えて差分を作成する方法。シードを固定してもポーズや構図が固定できない。

prompt
masterpiece, best quality, highly detailed 8k cg unity, 1girl, solo, full body, short purple hair, standing in the night cyberpunk city, genshin, clothing

negative prompt
lowres, bad anatomy, bad hands, missing fingers, pubic hair, extra digit, fewer digits, cropped, worst quality, low quality, blurry

prompt S/R
clothing, nsfw highly detailed race-trimmed bra panties undressing, nsfw completely nude
モデルは Easter

モデルは Easter

裸画像を先に作る実例

着せたい服がきまっている場合、先に裸画像を作る。そうすると肌のトーンの調整をする必要がなくなる。

ネガティブプロンプトは共通で long body, monochrome, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

プロンプト例:masterpiece, best quality, 1girl, completely nude in the park, blue archive, genshin

プロンプト例:masterpiece, best quality, 1girl, completely nude in the park, blue archive, genshin

インペイントで下着差分をつくる

インペイント

インペイント

プロンプト例:masterpiece, best quality, 1girl in the park, blue archive, genshin, underware, bra, panties

プロンプト例:masterpiece, best quality, 1girl in the park, blue archive, genshin, underware, bra, panties

インペイントで服差分をつくる

インペイント

インペイント

プロンプト例:masterpiece, best quality, 1girl wearing a dress in the park, blue archive, genshin

プロンプト例:masterpiece, best quality, 1girl wearing a dress in the park, blue archive, genshin

服を先に作る実例

生成した画像

seed=214927526<br/>inference steps=15<br/><br/>prompt<br/>bishojo, full body, view straight on, a girl wearing white one-piece with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and light green long hair and glaring eyes on sunny day standing,  golden hour lighting, strong rim light, art by krenz cushart and violet evergarden<br/><br/>negative prompt<br/>deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

seed=214927526
inference steps=15

prompt
bishojo, full body, view straight on, a girl wearing white one-piece with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and light green long hair and glaring eyes on sunny day standing, golden hour lighting, strong rim light, art by krenz cushart and violet evergarden

negative prompt
deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

マスクと修正した画像

修正画像は描く必要はない。Google 画像検索でそれっぽいのを拾ってきて、張り付けてもいいし、DAZ Studio で作成してもいい。今回は画像を少し拡大している。採用した画像は 20 枚作成したうちの1枚。

マスク

マスク

加工した画像

加工した画像

seed=787776388<br/>inference steps=26<br/>denoising strength=0.5<br/><br/>prompt<br/>bishojo, view straight on, a girl wearing luxury lingerie , jewelry,  ring,  louis comfort tiffany, garterbelt, stocking with white marble glowing skin and  light green long hair and glaring eyes on sunny day standing,  golden hour lighting, strong rim light, art by krenz cushart and violet evergarden<br/><br/>negative prompt<br/>生成に使ったのと同じ

seed=787776388
inference steps=26
denoising strength=0.5

prompt
bishojo, view straight on, a girl wearing luxury lingerie , jewelry, ring, louis comfort tiffany, garterbelt, stocking with white marble glowing skin and light green long hair and glaring eyes on sunny day standing, golden hour lighting, strong rim light, art by krenz cushart and violet evergarden

negative prompt
生成に使ったのと同じ

結果

合成結果

合成結果

写真を使う場合

使わせていただいた画像は[無料写真] メイド服を着て座る台湾人女性。自撮り画像を使ってもいいし、デッサン人形に服を着せた写真を使ってもいい。3Dなら MMD や VRoid Stduio、DAZ|Studio などがある。

入力画像

入力画像

結果

seed=453989191<br/>inference steps=50<br/>denoising strength=0.55<br/><br/>prompt<br/>view straight on, small breasts, a blonde bishojo wearing a black maid cosplay with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and light green long hair and glaring eyes on sunny day standing,  golden hour lighting, strong rim light, art by krenz cushart and violet evergarden<br/><br/>negative prompt<br/>deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

seed=453989191
inference steps=50
denoising strength=0.55

prompt
view straight on, small breasts, a blonde bishojo wearing a black maid cosplay with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and light green long hair and glaring eyes on sunny day standing, golden hour lighting, strong rim light, art by krenz cushart and violet evergarden

negative prompt
deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

Google 画像検索+img2img

Waifu Diffusion (Stable Diffusion)で時間がかかるのは構図を決定するシードガチャだ。そこで Google 画像検索でいい感じの構図(3次2次問わない)の画像を img2img に入力すれば時短になる。

このワークフローを採用する場合、画像が見つかったら、工程2から始められる。

著作権について

Stable Diffusion には画像の一部だけを修正できる inpaint 機能がある。拾ってきた画像でこの inpaint 機能だけを使った場合、同一性保持権(20条1項)の侵害になる。

ツールの選択

AUTOMATIC1111 と ComfyUI がユーザーが多い。AUTOMATIC1111 をカスタムして軽量化した Forge もよく使われている。

ComfyUI

Comfy はノードベースで画像を生成できる。新しいモデルの対応も速く、AUTOMATIC1111 にある大抵の機能はサポートされている。

Stable Diffusion モデルリンク

最近リリースされたモデルは CIVITAIhuggingface を探せば見つかる。

古いモデルは Stable Diffusion の古い情報に移動した。

XL

Illustrious XL v0.1

タグで版権キャラが出しやすい。年代タグを使うと画風を変化させられる

派生モデルは NoobAI-XL が人気が高い。アーティストブレンド例

モデル=Illustrious XL v0.1<br/>解像度 1,024 x 1,536 での作例。Hires. fix 未使用<br/>seed=1972571351<br/>Sampling method=Euler a<br/>inference steps=50<br/><br/>prompt<br/>masterpiece, best quality, extremely dark, black theme, fantasy city night, ruined castles, large blue moon, shiori novella sitting on the stone, shiny colors, (realistic:0.3), slender, medium breasts, head tilt, hand gesture, choker, knee boots, jacket, smile (grin:0.8), (ishikei:0.1)<br/><br/>negative prompt<br/>censored, hat, jpeg artifacts, lowres, bad hands, missing fingers, cropped, blurry, twintails, hair bun, animal ears, sneakers, shoes, worst quality, bad quality, average quality, good quality, comic, earrings, pool

モデル=Illustrious XL v0.1
解像度 1,024 x 1,536 での作例。Hires. fix 未使用
seed=1972571351
Sampling method=Euler a
inference steps=50

prompt
masterpiece, best quality, extremely dark, black theme, fantasy city night, ruined castles, large blue moon, shiori novella sitting on the stone, shiny colors, (realistic:0.3), slender, medium breasts, head tilt, hand gesture, choker, knee boots, jacket, smile (grin:0.8), (ishikei:0.1)

negative prompt
censored, hat, jpeg artifacts, lowres, bad hands, missing fingers, cropped, blurry, twintails, hair bun, animal ears, sneakers, shoes, worst quality, bad quality, average quality, good quality, comic, earrings, pool

Animagine XL

タグで版権キャラが出しやすい。

ANIMAGINE XL 3.1 Announcing Animagine XL 3.1

Animagine XL V3 使い方が特殊なので詳細は公式ブログを参照。

Pony

エロに強いモデル。クオリティタグが特殊

Pony Diffusion V6 XL

Pony Diffusion for Anime

ebara pony

3x3x3mixXL

そのほか

ArtiWaifu Diffusion 1.0

AAM XL (Anime Mix)

DMD2(高速化)

LoRA の DMD2 を適用すると4ステップ前後で生成できる。

使い方

1. CFG Scale を1に近い値(1.01~1.5 など)にする

CFG Scale を1にするとネガティブプロンプトが使えなくなるので手打ちで CFG Scale を入力する。

2. まともに生成できるサンプラーを探す
3. 調整する

モデルマージ

Merge Models

Models, Embeddings, and Hypernetworks

STABLE DIFFUSION MIXING EMPORIUM

階層マージ

Merge Block Weighted - GUI (U-Net のブロックごとにマージ比率を変える)

Safetensor Merger Multi Thread

NovelAI 5ch Wiki#階層マージ

Stable DiffusionのモデルをU-Netの深さに応じて比率を変えてマージする

sd_merge_numa (マージしてサンプル画像を出力する検証用 Extension)

Stable Diffusion のパラメーターの解説

CFG Scale

拡散モデルはノイズ画像からノイズを予測し、ノイズ画像から予測ノイズを除去することで絵を描く。

CFG Scale は予測ノイズの強度をスケールするパラメータだ。5~9が適正値で以下のような特徴がある。作例のプロンプト・ネガティブプロンプト・シード値は同じで、違いは CFG Scale とステップ数のみ。

CFG Scale が高い場合

CFG Scale=14, Sampling steps=20

CFG Scale=14, Sampling steps=20

CFG Scale が低い

CFG Scale=3, Sampling steps=100

CFG Scale=3, Sampling steps=100

詳細な解説

CFG Scale は Classifier-Free Diffusion Guidance が詳しい。拡散モデルに追加の classifier ネットワークを追加して同時に学習すると性能が向上するが、classifier のみを分離できず、ネットワークも複雑になる。Classifier-Free Diffusion Guidance ではプロンプトなしのノイズ予測を利用して classifier 利用時と同じような性能向上を実現した。この論文ではプロンプトありのノイズ予測から、プロンプトなしのノイズ予測を引き算している。その結果のスケール量が CFG Scale だ。

Stable Diffusion 1.5 では以下のコードで CFG Scale が使われている

e_t_uncond, e_t = self.model.apply_model(x_in, t_in, c_in).chunk(2)
e_t = e_t_uncond + unconditional_guidance_scale * (e_t - e_t_uncond)

このコードはプロンプトのみを使ったノイズ予測から、プロンプトを使わないノイズ予測を引き算している。CFG Scale は引き算後の計算結果をスケールするのに使われている。このプロンプトを使わないノイズ予測の部分に描いてほしくないプロンプトを使うというコンセプトがネガティブプロンプトだ。

CFG Scale は単純に予測ノイズをスケールしているだけなので、CFG Scale を低くする場合はステップ数を多くしないとノイズ除去が不十分になる。逆に CFG Scale が高すぎると、ノイズ除去が強すぎて意味のある画像が出力されない。

また数式から、CFG Scale(unconditional_guidance_scale)= 1 の時ネガティブプロンプトの効果がなくなることがわかる。

外部リンク

Classifier-Free Diffusion Guidance

Guiding a Diffusion Model with a Bad Version of Itself

サンプラー

結論を言うと Euler a か DPM++ 2M Karras を使うのがおすすめだ。理由はそれぞれ似た画風の中で一番速いから。Euler a はステップ数を増やすと絵が変わることに注意。

Stable Diffusion 3 は U-Net ではなく MMDiT(Multimodal Diffusion Transformer) を使っていることに注意。

a 付きサンプラーの絵が変化する理由

後ろに小文字の a (ancestral) が付くサンプラーはサンプリング時にノイズを付与することでランダム性を出している。なので、ステップ数を上げても収束しない。

外部リンク

Stable Diffusion Samplers: A Comprehensive Guide

DDPM, DDIM, SDE のサンプラーや拡散モデルの解説は Diffusion Models: Tutorial and Survey が詳しい。

Euler a のノイズを付与している部分のコード

シード

拡散モデルはノイズ画像からノイズ除去を繰り返すことで絵を描く。その初期ノイズの乱数パターンを指定する。シードを固定しても、解像度を変更すると絵は大きく変わる。

Denoising Strength について

Denoising Strength はステップ数と絵を描く過程とに影響を与える。

Denoising Strength を小さくすると指定したステップ数より少ないステップ数しか実行されないので画質が下がる。Denoising Strength を 0.1 のような小さな値に設定する場合はステップ数は 200 以上必要になることもある。

AI は大まかな形を描いてから細部を描く。Denoising Strength が大きい(1に近い)と大まかな形を描く段階から始めるので絵が大きく変化する。Denoising Strength が小さいと細部の描きこみを行うステップから始めるので、全体像はほとんど変化しない。

バッチカウントとバッチサイズ

小さい画像サイズでプロンプトの調整をする場合は、バッチサイズを最大にすると速い。

バッチカウントは画像の生成枚数。バッチサイズは並列生成する枚数だ。最終的な生成枚数はバッチカウント×バッチサイズになる。

バッチサイズは余計に VRAM を消費するが生成は速くなる。RTX 3050 で 384x512 のサイズの画像を作成する場合、以下のような結果になった。

バッチカウントバッチサイズ生成にかかった時間(秒)VRAM 使用量(GB)
81154.1
18105.1
161314.1
116195.9

GPU の種類と画像生成時間

VRAM で生成できる解像度の上限が決まるので、VRAM で GPU を選ぶ。最低ラインは 12 GB。8GBでも生成なら問題ないが、将来性に不安がある。

【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】

NovelAI 5ch Wiki#結果一覧も情報が多い。

Tips

上手く描けない場合はアスペクト比を変えてみる

1:1のアスペクト比で上手く描けない場合は、縦長や横長にすると上手く描ける場合がある。人物は縦長の方が形が崩れにくい。船は横長だと上手く描ける。

身体が切られる場合は映す部位の指定する

顔に注目させたいなら face close-up。

膝や脚まで入れるなら head to knee や head to leg。

バストアップなら breast。

上半身なら upper body。

膝より上の場合なら "full body, thigh" をプロンプトの先頭に持ってくる。

すねも入れるなら "full body, legs" をプロンプトの先頭に持ってくる。

足も入れるなら "leg line" や "full body, shoes" をプロンプトの先頭に持ってくる。

クオリティタグを使う

モデルによっては masterpiece, best quality, score_9 などのクオリティタグが存在する。プロンプトでそれらを指定することで、クオリティを上げられる。

CFG Scale を上げる

CFG Scale を上げると簡単に画力を上げられるが、ポーズや構図がありきたりになる。上げすぎるとコントラストや彩度が高い、くどい絵になる。

解像度を上げると頭や体が複数融合する

AUTOMATIC1111 の Highres. fix を使う。

細部の修正

AUTOMATIC1111 の拡張機能の ADetailer 等はこの項目の工程をすべて自動化してくれる。

Stable Diffusion (Waifu Diffusion)は細部が崩れやすい。全身が入る構図だと確実に顔が崩れる。なので、細部の修正に inpaint を使うのは意味がない。細部を修正する場合は inpaint を使うのではなく、以下のように自力で合成する。

  1. 適当なペイントソフトで修正したい部分を切り出して 512px * 512px に拡大
  2. 切り出した画像を img2img に入力して、同じプロンプトで再度画像を生成
  3. 生成した画像をペイントソフトで縮小して合成
元画像<br/>extremely detailed CG unity 8k wallpaper of a loli girl with silver long wavy hairstyle and white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring red eyes, wearing fantasic dress with many frills, standing in the baroque architecture, art by krenz cushart and violet_evergarden, golden hour lighting, strong rim light, intense shadows, bokeh<br/><br/>seed=246225998

元画像
extremely detailed CG unity 8k wallpaper of a loli girl with silver long wavy hairstyle and white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring red eyes, wearing fantasic dress with many frills, standing in the baroque architecture, art by krenz cushart and violet_evergarden, golden hour lighting, strong rim light, intense shadows, bokeh

seed=246225998

切り出して加筆した画像

切り出して加筆した画像

生成された画像(10枚作成した内の1枚)

生成された画像(10枚作成した内の1枚)

合成結果

合成結果

手の修正

Waifu Diffusion (Stable Diffusion)は手が上手く描けない。この対策は2つある。ひとつはネガティブプロンプトを使う方法で、もうひとつは自分の手を使う方法だ。

自分の手を使う方法

自分の手をスマホで撮影して、手の部分を切り出して出力画像に張り付ける。その加工した画像を img2img に入力する。

Clip Studio Paint で手の3Dオブジェクトを使う方法がある。

手の自由度

手の自由度低いポーズは上手く描ける。例えば skirt hold, skirt lifted by self, spread pussy, double v など。

高解像度化

AUTOMATIC1111での高解像度化は以下の方法が高品質だ。

  1. Highres fix でマシンが生成できるの最大解像度で生成する
  2. アップスケーラーで高解像度化する

高解像度化手法

高解像度化には2つの方法がある。アップスケーラーを使う方法と、アウトペインティングを使う方法とだ。

アップスケーラー

アップスケーラーは AI を使って画像を拡大する。

アウトペインティング

アップスケーラーと違い、アウトペインティングはすでに作成した画像に追記して拡張する。アウトペインティングは AUTOMATIC1111 で使える。

色のコントロール

AI が色の指定を無視した場合に、色を修正する方法は5つある。

  1. ペイントアプリで編集する
  2. インペイントで編集する
  3. Guidance Scale を上げる
  4. AUTOMATIC1111 の Prompt Editing を使う

ディティールが欲しいとき

解像度を上げるか、img2img で追加するか、以下のような語をプロンプトに追加する。

プロンプト

プロンプトで出力を詳細に制御するのは不可能だ。img2img を使って画像を加工する方がはるかに早い。今後も Stable Diffusion を使うつもりがあるならば、板タブか液タブを買って、基本的な画像編集ができるようになった方がいい。

ネガティブプロンプトはとても強力だ。『描いてほしくないもの』を指定することで効率的な絞り込みができる。

Danbooru タグ列挙法は Stable Diffusion の古い情報 に移動した。

テキスト生成AIを使う方法

ChatGPTによるプロンプトの生成

ChatGPT、Bingによるプロンプトの生成・変換(NyaFuさんバージョン)

プロンプトの探し方

danbooru

danbooru は日本語で検索できる。

魔術書(Novel AI)

NovelAI 5ch Wiki

NovelAI 5ch Wiki#詠唱全文

ムフフな元素法典 v1.1

AIイラストテクニック

I USE STABLE DIFFUSION USING DANBOORU/WAIFU MODEL (ビクトリア朝油彩)

Faces-Faces-Faces

Stable Diffusion Prompt Book

Prompt Search

배경학개론(背景学概論)

中国語

元素法典——Novel AI 元素魔法全收录

元素法典の日本語翻訳

NovelAI元素法典(第1巻)の日本語訳

禁忌魔典(異形・クリーチャー・流血表現)

元素法典第一点五卷——Novel AI 元素魔法全收录

元素法典第贰卷

解构原典 Deconstructive canon

元素同典(AUTOMATIC1111 の使い方)

ツール

プロンプトジェネレーター

Novel AI プロンプトジェネレータースプレッドシート

魔咒百科词典(プロンプトジェネレーター)

NovelAI Tag Generator。右クリックして翻訳できる。

NovelAIのプロンプトを管理・調整するChrome拡張を作りました

タグ調査

danbooru のタググループ

aibooru

Deep Danbooru

アップロードした画像の Danbooru タグを教えてくれる。

メタデータ閲覧

PNG file chunk inspector

imginfo

TweakPNG (Windows アプリ)

画像が AUTOMATIC1111 で作成された場合、プロンプト等の情報は画像ファイルに埋め込むこともできる。画像があればプロンプト等が公開されていなくてもこれで確認できる可能性がある。

clip-interrogator

画像からプロンプトを推測するツール。AUTOMATIC1111からも使える。

DeepL

日英翻訳。日本語で書いた文章を翻訳して、そのままプロンプトに入れる。

Lexica

テキストから、他の Stable Diffusion のユーザーが作成した画像を調べられる。

NovelAI Prompt整理ツール

スプレッドシートを使ったプロンプト管理ツール。

Stable Diffusion Prompt Generator

プロンプトを入力すると、アーティストや場所やライティングのプロンプトを追加してくれるジェネレーター。

クオリティタグ

モデルによっては masterpiece, best quality, score_9 などのクオリティタグが存在する。プロンプトでそれらを指定することで、クオリティを上げられる。

クオリティタグは学習素材の不足が原因で使われている。モデルの学習には大量の画像が必要で、masterpiece の画像だけでは学習するのに不十分だ。より少ない学習画像で学習できる方法が見つかれば、クオリティタグは不要になるかもしれない。

ワードのウェイト

プロンプトの語順は前のほうが影響力が強く、後ろの方の語は無視されやすい。

無視してほしくない語は繰り返すのが有効。たとえばショートケーキを出したければ、"strawberry shortcake, tiny golden puppy eating strawberry shortcake” とする。これが単に "tiny golden puppy eating strawberry shortcake" だと、ショーケーキが無視されて苺だけが出現したりする。

AUTOMATIC1111 のウェイト

AUTOMATIC1111は () でポジティブなウェイト、[] でネガティブなウェイトをつけられる。() や [] は重ねると強調される。後ろの方のプロンプトは無視されがちなので、その対策によく使われる。

a girl with [silver] hair and (blue eyes:1.2)
ウェイト V.S. 位置

ウェイトよりプロンプトの位置の方が影響力が強い。なので画風の影響力を小さくしたい場合は、画風やアーティストタグをウェイトだけ調整するのではなく、プロンプト後方へ配置するとタグの影響力を制御できる。

ウェイトの場所
出典:boards.4chan.org/h/thread/6856108#p6856938

出典:boards.4chan.org/h/thread/6856108#p6856938

文字通りの ()

AUTOMATIC1111 では "\(\)" で文字通りの () が入力できる。文字通りの () は danbooru タグで名前の衝突を解決するときによく使われる。

参考リンク

SD GUIDE FOR ARTISTS AND NON-ARTISTS IN-DEPTH TIPS, TRICKS, TUTORIALS AND MORE

Understanding Weights

プロンプトのトークンについて

プロンプトは最長で 75 トークン。1単語1トークンとは限らない。

Stable Diffusion のテキストエンコーダーは大文字小文字を区別しない。

Stable Diffusion のテキストエンコーダーの語彙は3万語程度。

プロンプトのトークン制限

プロンプトのトークン数の制限は、使用しているテキストエンコーダーに依存する。Stable Diffuison は 75 トークンが上限になる。

この制限がないツールはプロンプトを分割してトークンに変換した後、トークンをマージすることでこの制限を回避している。なので文の途中でプロンプトが分割されると、意図しない出力になる。AUTOMATIC1111 では BREAK を入れると任意の位置でプロンプトを分割できる。

外部リンク

Stable Diffusion Akashic Records

ネガティブプロンプト

ネガティブプロンプトも通常のプロンプト同様に 75 トークンまでしか認識しないが、トークンマージによって制限を回避しているツールもある

使用例

たとえば目を閉じさせたいとする。closed eye をプロンプトに指定しても目を閉じない場合に、open eye をネガティブに入れる。

言外の意味(connotation)の除去にもネガティブプロンプトは使える。たとえば blonde は女性の金髪という意味を持っている。blonde から女性の意味を除去するにはネガティブプロンプトに woman や girl を入力する。

ショーツを途中まで脱がせる panty pull という言葉がある。しかし panty pull には panty が含まれるので、二重にショーツをつけている絵がよく出力される。プロンプトに panty pull を指定し、ネガティブに panties を指定することで、二重ショーツ問題に対処できる。

線画の着色にもネガティブプロンプトが使える。ラフを img2img するさいに monochrome をネガティブにすると線画に色をつけてくれる。ただし確実ではないので下塗りをした方がいい。

ネガティブプロンプトは検証が必要だ。 mutated hands and fingers の検証では手をうまく描くのではなく隠すようになっている。

注意点

ネガティブプロンプトはプロンプトとして入力しても効果のあるものでないといけない。たとえば danbooru タグで訓練されたモデルで、データが 90 程度しかない missing finger をネガティブプロンプトに入れてもその効果はない。

ネガティブプロンプトは予期しない画質や画風の変化が起こることがある。なので、プロンプトや extension で解決できない問題のみをネガティブプロンプトで解消するようにした方がいい。

人体に関する汎用ネガティブプロンプト

以下のネガティブプロンプトを入れると画力が上がる。

Novel AI のデフォルトネガティブプロンプト

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

全体

bad art, ugly, messy drawing, flesh pile

flesh pile=蓮コラ。

身体・手足

deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, fat, obese, missing limb, floating limbs, disconnected limbs, long neck, long body, part of the head, poorly drawn feet, mutated skeleton, long skeleton, bad proportions, 2girls, snuggled, dismemberment

変な場所から手や脚が生えるのは 2girls や 3girls、snuggled をネガティブに指定する。

分詞形(deformed や mutated、drawing など)は2トークン消費する。

手・指

mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, bad hands

poorly drawn face, poorly drawn asymmetrical eyes, big ears, mutated face

nose:鼻を点で描いた画風になりやすくなる。

head out of frame :顔の大部分が切られる場合

smile, happy, pleasure:目のハイライトを消す

表情

troubled eyebrows, blush, smile, happy, pleasure:無表情を作りたいときに

open mouth, teeth:口を閉じさせたいときに

エルフ耳

sharp ears, pointy ears, animal ear

乳首

extra nipples

巨乳

tits, huge breast

横乳

sideboob

画風に関するネガティブプロンプト

リアル風・3DCG風

portrait, portrait face は Danbooru のタグにないので、これを入れるとリアル風の画風を抑制してくれる。

portrait, portrait face, doll, photo face, Korean face, Asian face, African face

octane render, 3d, unity, unreal, maya :3DCG風になる場合、octane render は特に効果がある。

アニメ・イラスト風

anime, comic, manga :リアル寄りにしたい場合

カートゥーン

western

ボケ

blurry, blur, out of focus, bokeh, fog

平坦な色使い

flat shading, flat color:画面が華やかになる

グレー

grayscale, black&white, monochrome :カラー画像を出力したい場合。漫画からデータを拾ってくるとよくグレーになる。

文字

text, text title signature

漫画の吹き出し

speech bubble

コマが割られる

multiple views, comic, manga, split screen

アーティスト

変な絵を描くアーティストをネガティブに入れておくと変な絵は出にくくなる。

(pablo picasso), (H.R. Giger), (Gustave Dore), (Chaim Soutine), (Flora Borsi), (vincent van gogh), (paul gauguin), cubism

複数人生成する場合

1girl, solo, symmetrical

symmetrical が入っているのは、全員が正面顔でこちらを見ている絵が出ないようにするため。

yiffy モデルでケモ成分をおさえる

animal, furry

ネガティブプロンプトの実装

ネガティブプロンプトは CFG Scale と関連が深い。もともとの CFG Scale はプロンプトなしのノイズ予測を使用して、性能を向上するテクニックだった。そこで、プロンプトなしのノイズ予測ではなく、描いてほしくないプロンプトのノイズ予測を利用したのがネガティブプロンプトだ。

ネガティブプロンプトはプロンプトを引き算しているのではない。プロンプトのみを使って予測したノイズとネガティブプロンプトのみを使って予測したノイズとを引き算している。引き算した結果は CFG Scale でスケールされるが、詳細は CFG Scale を参照。

AUTOMATIC1111 の Prompt Editing

Prompt Editing は画像生成の途中でプロンプトを変更する機能だ。Prompt Editing を使うと通常では不可能な表現が可能になる。たとえば "a girl [wearing a onepiece:naked:0.5]" とすると、服が透けている表現になる。これはステップ数が 50 とすると、最初の 1~25 ステップは "a girl wearing a onepiece" を実行し、26~50 ステップは "a girl naked" を実行する。

色のコントロール

Prompt Editing

黒いドレスと銀髪の例

Regional Prompter

Automatic1111 の Extension の Regional Prompter はプロンプトの効く領域を指定できるので、これで対策することもできる。

BREAK

プロンプトに BREAK を入れると、プロンプトが分割される。色ごとにプロンプトを分割すると色移りしづらくなる。

Stable Diffusion のプロンプト Tips

何も指定しない(たとえば "a kawaii girl")と平面的な絵しか出てこない。なのでディティールの足りない部分を見つけて、プロンプトに追加していく必要がある。

プロンプトの語順は前のほうが影響力が強く、後ろの方の語は無視されやすいので、複数の色を指定するプロンプトは制御しづらい。たとえば "a loli girl with long white hair wares pink dress and blue shoes." のようなプロンプトでは青い靴は無視されがちになる。青い靴を文頭に持ってくると、服や髪が青くなったりする。

語には言外の意味(connotation)が含まれる。たとえば blonde は金髪だけではなくて、女性にたいして使われることが多い。blonde から女性の意味を除去するにはネガティブプロンプトに woman や girl を入力する必要がある。

2つのオブジェクトを融合するのに as が使える。たとえばヨーダのようなガンジーを描くには "ghandi as yoda" にする。

人物を作成するには、プロンプトに以下の5つの要素を入れるといい。ただしプロンプトの語順は前のほうが影響力が強いので、背景より人物が重要な場合は、人物を先に描写する必要がある。背景を先に描写してしまうと人物をどれだけ詳細に書いても無視されることがある。逆に人物を先に描写するとポートレート風の画像がよく作成される。

色に関する Danbooru タグは tag group:colors を参照。

天気・時間帯・ライティング

場所・背景

背景にこだわりがない場合、beautiful landscape と書いておくといい感じにしてくれる。bokeh や soft focus などの語で背景をぼかすのも可。季節を表す語は最後においても結構効果があるのでおすすめ。

外国人受け入れのための博物館用語集(英語)

背景の拡張に Photoshop のジェネレーティブ塗りつぶしが使える。

建物
平地
季節
ダーク
ファンタジー
日本
食べ物
そのほか
映す範囲

tag group:image composition

構図や映す範囲は以下の要素で決まる。

アスペクト比は重要だ。人物は縦長の方が良い結果が得られやすい。船は横長の方が上手く描ける。

身体を重視する場合は full body や tachi-e か breasts, navel, thighhighs, などの語をすべて入れる。靴を指定するのも有効。

アングル

landing のように地面を指定するとアイレベルが下がり、絵に変化が生まれる。

正面

防犯カメラ

引き・俯瞰・全身

俯瞰

  • tachi-e (立ち絵)
  • full body
  • wide shot
  • panorama
  • giant (巨人)
  • giantess (巨大娘)
  • from far away
  • foreshortening (広角レンズで寄ることでパースが強調された絵。 fisheye もよく使われる)
  • ライブ
    よくわからない場所
    人物なし
    部屋
    汚部屋

    Faces-Faces-Faces

    人は指定できる要素が多い。映す範囲、髪型、髪の長さ、色、肌の色、目の色、口の開け具合、ポーズ、表情、服、服の柄、年齢など。

    highly detailed symmetric faces や extremely detailed symmetric faces、very gorgeous face は定番。だが顔をトリミングして、img2img で顔だけ再生成したものを後からペイントソフトで合成する方が高品質だ。

    目を強調したい場合は "symmetric highly detailed eyes, fantastic eyes, intricate eyes" を追加する。

    棒立ちになる場合は contrapposto を入れる。

    人数

    複数人出すと肌が融合しがちなので、長袖やスラックスを着せると融合しにくくなる。

    kawaii
    ロリ

    Danbooru の loli タグは閲覧が有料なので、代わりに flat chest を使う。

    褐色
    ロボ
    擬人化
    等身
    年齢

    中年は 30 years old や 40 yeas old など直接年齢を指定する。30yo という短縮形も認識される。中年は makeup も効果的。ネガティブに (child:1.5) なども有効。

    表情

    #NovelAI #WaifuDiffusion で表情を完全攻略するためのプロンプト辞典 [WIP]

    Face Tags Experiments

    無表情はネガティブプロンプトに troubled eyebrows, blush, smile を入れると作りやすい。

    プロンプトに「confused, smile, crying, angry, multiple views」とすると、表情カタログが出力される。

    メイク

    lips を入れると画風が変化するので、それを嫌う場合はネガティブに 3d を入れる。

    感情

    食べる

    eat が効かない場合は吐き出させる(vomit, spitting)。

    dot nose

    特殊な瞳

    ハイライトを消す

    眼鏡

    NovelAIで女性の髪形の呪文(コマンド)がわからないのでお団子ヘアーなど片っ端から検証してみた

    マルチカラー

    アクセサリー

    解像度

    服や顔の前に解像度ワードを入れると複雑なテクスチャになる。highly detaiiled face や extremely detailed lace、insanely detailed frills など。

    NovelAIの為のファッションブランド(女性編)

    NovelAIでの衣装呪文一覧カタログ、全身女性立ち絵呪文と絵文字立ち絵構文のカタログ

    服についての検証は A test of seeds, clothing, and clothing modifications が詳しい。ネックラインや帽子の種類を指定してもほとんど無視される。おそらく学習用画像のタグを付ける人が服飾に詳しくないからだろう。

    上下セット

  • otokoyaku (宮廷衣装)
  • nun (修道女)
  • habit (修道服)
  • acolyte (ラグナロクオンラインの修道女)
  • olympic スポーツ名 competition (lacrosse, wrestling, rhythmic gymnastics など)
  • bike shorts (サイクルウェア)
    自転車が邪魔なときは spandex shorts
  • fantasy priest
  • bodystocking (全身タイツ)
  • romper (ロンパース)
  • bikini armor (ビキニアーマー)
  • playboy bunny (バニー)
  • witch (魔女)
  • military uniform (軍服)
  • suit (スーツ)
  • china dress (チャイナドレス)
  • jersey (ジャージ)
  • knightess (レディースの鎧)
  • overalls (オーバーオール)
  • sarong (パレオ)
  • loincloth (腰布)
  • yukata (浴衣)
  • mecha pilot suit (パイロットスーツ)
  • pinafore dress (ジャンパースカート)
  • travel attendant (客室乗務員)
  • flight attendant (客室乗務員)
  • waitress (ウェイトレス)
  • dirndl (ディアンドル、村娘、メイド服のようなもの)
    1girl with low twintails wear dirndl holding a basket of breads in the medieval village
  • idle costume (アイドル衣装)
  • halloween costume (ハロウィン仮装)
  • leotard
  • 学校
  • wedding
  • 水着
  • 装飾

    その他の服

    レース

    腕・肩

    透過

    AUTOMATIC1111の Prompt Editing で [cloth:nude:0.5] 等とする方法や、服を着た画像を img2img に入力して、nude 等のプロンプトで作成する方法がある。

    体形

    脂肪量を調整する Weight Slider - LoRA がある。

    skinny だけでは脚は普通になりやすいので、脚も補足する場合は (slim legs:1.2), skinny hip, skinny thighs も入れる。

    活動

    verb tag list

    ポーズ

    ポーズを固定したい場合は、ControlNet を使う。

    NovelAI呪文研究【ポーズ編】

    百合キス
    エフェクト

    椅子
    そのほか

    食べ物の絵文字

    銃は型番で指定すると品質が上がる。

    カメラ

    カメラ系の語は Stable Diffusion や Waifu Diffusion v1.2 で効果がある。

    カメラ、レンズ、シャッタースピード、絞り、ISO を指定するが、Waifu Diffusion では影響が小さい。

    ボケをなくしたいときは blur や bokeh をネガティブプロンプトに入れる。sharp focus みたいな語をプロンプトに入れても意味がない。なぜならピントが合っている写真にいちいち sharp focus みたいなタグをつけないから。

    ライティング

    シーンライティング

    オブジェクトライティング

    UI・動画配信風

    作風

    作風リスト
    リアル
    アウトライン
    線画
    線画なしフラットイラスト
    ドローイングスタイル

    sketch, graphite \(medium\) を入れると、手や細部の粗が目立たない。

    画風

    ランダムなテキストを入力すると抽象画になる

    アニメ

    イラスト

    複数

    character sheet of は横顔や斜め後ろ姿等を描いてくれるので、設定を作るときに便利。ただし服装や色が違ったりする。

    特殊

    モノクロ

    人名

    Map

    検証

    mutated hands and fingers の検証では手をうまく描くのではなく隠すようになっている。out of frame cropped は頭が切られる問題の対策にはならなかった。

    汎用呪文プロンプトの検証をしてみた-PART1-

    汎用呪文プロンプトの検証をしてみた -PART2 語順編-

    PART3 -プロンプトの工夫で指定色が混ざるのを防ぐ方法-

    AI が描いた絵の見分け方

    画像生成AIによって生成されたイラストの見分け方

    AIが自動生成した画像かどうか見破って判別できると自称する複数のツールをテストした結果とは?)

    無加工の場合は、手と拡大した目を見ればすぐにわかる。現在の画像生成 AI は画像を圧縮した状態で絵を描いているため、細部がつぶれる。なので、AI らしさをすべて修正するためには画像全体をレタッチする必要がある。

    1. 細部が甘い

    2. 背景の連続性がない

    3. png なのに jpeg ノイズがある

    AI は jpeg ノイズを学習してしまっているので、png で保存された画像にも jpeg ノイズが乗る。ただし、jpeg 画像でコラージュされている場合は AI が生成したとは限らない。

    AI が描いた絵の識別テスト

    Human or AI

    Human or AI 2

    外部リンク

    NSFW(職場閲覧注意)

    単語集

    NovelAIでセンシティブ画像を作ろう教室

    nude と completely nude

    danbooru タグの nude は胸と股間にだけ服がない状態全裸は completely nude を使う

    場所

    関係性

    大人数

    性器など

    ペニス

    irrumatio (イラマチオ)は竿役が動き、fellatio (フェラチオ)は咥える側が動く。

    触手

    触手は髪と融合しがちなので splatoon, inkling, fused hair あたりをネガティブに入れる。

    表情

    体位

    This Is What Your Sex-Position Bucket List Should Look Like

    ポーズ

    バックの場合

    stomach, navel, boob のような正面から見えるパーツをネガティブに入れる。

    脱衣

    ネガティブに see-through, nipples を入れると服の上から乳首が描かれるのを軽減できる。

    〇〇 lift は〇〇をネガティブに入れると2重描写を防げる。例えば camisole lift の場合は camisole をネガティブに入れる。panty pull も同様。例:naked, camisole lift, panty pull ネガティブ camisole, panties, panty。

    露出

    装飾

    ショーツの後ろにリボンがつく場合は、ネガに ribbon panties, bow panties。

    乳全般

    サイズや形状については breasts を参照。

    oppai も使える。

    巨乳

    普乳

    貧乳

    貧乳は巨乳系の語をネガティブプロンプトに入れるのが確実だ。flat chest は有料の loli タグの代わりに使われていて、ロリ化する傾向にある。9yo のように年齢を指定する方法もある。

    大人の貧乳は tall female, mature female, skinny, narrow waist, 190cm 等を併用して、ネガティブに child 等を入れる。

    精液

    img2img を使うと好きな場所に精液を配置できる。

    ゴム

    事後

    暴力

    そのほか

    作例

    Waifu Diffusion v1.3

    Seed=1348206(左), 1348211(右)<br/>Steps=20<br/>Sampler=Euler a<br/>CFG scale=7.5<br/>Size=384x640<br/><br/>prompt<br/>absurdres, 1girl, jirai kei, choker, collared shirt, earrings, frills, looking at viewer, medium hair, pink hair, ring, <br/><br/>negative prompt<br/>pablo picasso, long neck, long body, extra heads, bad anatomy, bad proportions, extra limbs, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, skin defects, Shoulder oracle bone, backshot tooth

    Seed=1348206(左), 1348211(右)
    Steps=20
    Sampler=Euler a
    CFG scale=7.5
    Size=384x640

    prompt
    absurdres, 1girl, jirai kei, choker, collared shirt, earrings, frills, looking at viewer, medium hair, pink hair, ring,

    negative prompt
    pablo picasso, long neck, long body, extra heads, bad anatomy, bad proportions, extra limbs, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, skin defects, Shoulder oracle bone, backshot tooth

    Waifu Diffusion v1.2

    作成環境

    typo が含まれているのでプロンプトは適宜直してください。たとえば bishojo 間違いで、正しい綴りは bishoujo。

    1girl looking_at_viewer upper_body, too many flowers,kyoto animation, bishojo, bare_shoulders black_sleeves yellow_eyes emeraldblue_hair, sailor_collar and neckerchief, detached_sleeves frilled_shirt_collar frills grey_shirt headset heart long_hair sleeveless_shirt twintails very_long_hair wide_sleeves highres<br/>seed=514388629<br/>inference steps=15<!-- 1girl looking_at_viewer upper_body, too many flowers,Kyoto Animation, Bishojo, bare_shoulders black_sleeves yellow_eyes emeraldblue_hair, sailor_collar and neckerchief, detached_sleeves frilled_shirt_collar frills grey_shirt headset heart long_hair sleeveless_shirt twintails very_long_hair wide_sleeves highres. Delicate facial features. Trending on Danbooru.-->

    1girl looking_at_viewer upper_body, too many flowers,kyoto animation, bishojo, bare_shoulders black_sleeves yellow_eyes emeraldblue_hair, sailor_collar and neckerchief, detached_sleeves frilled_shirt_collar frills grey_shirt headset heart long_hair sleeveless_shirt twintails very_long_hair wide_sleeves highres
    seed=514388629
    inference steps=15

    seed=525803891<br/>inference steps=15<br/><br/>prompt<br/>pinup Comic art, thick-line-drawing, bold outline, air-brush-paint, loli Turquoise twin tail, blush, extremely detailed symmetric faces, JoJo's Bizarre Adventure, decollete cleavage, simple studio lighting<br/><br/>negative prompt<br/>deformed, bad_anatomy, disfigured, mutation, mutated, extra_limbs, ugly, fat, missing_limb, floating_limbs, disconnected_limbs, long_neck, long_body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly_drawn hands,  malformed_hands, poorly_drawn face,poorly_drawn asymmetrical eyes

    seed=525803891
    inference steps=15

    prompt
    pinup Comic art, thick-line-drawing, bold outline, air-brush-paint, loli Turquoise twin tail, blush, extremely detailed symmetric faces, JoJo's Bizarre Adventure, decollete cleavage, simple studio lighting

    negative prompt
    deformed, bad_anatomy, disfigured, mutation, mutated, extra_limbs, ugly, fat, missing_limb, floating_limbs, disconnected_limbs, long_neck, long_body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly_drawn hands, malformed_hands, poorly_drawn face,poorly_drawn asymmetrical eyes

    extremely detailed loli 1girl, beautiful character professional portrait of a kawaii girl in elaborately embroidered print_kimono, looking_away, golden hour, from_side, white marble glowing skin, pretty lively blue_eyes and iris, blush, dot_nose, gray bun hair, subsurface scattering, style of anime film, cobblestone road, soft ambient lighting, light_rays<br/>seed=637316554<br/>inference steps=30

    extremely detailed loli 1girl, beautiful character professional portrait of a kawaii girl in elaborately embroidered print_kimono, looking_away, golden hour, from_side, white marble glowing skin, pretty lively blue_eyes and iris, blush, dot_nose, gray bun hair, subsurface scattering, style of anime film, cobblestone road, soft ambient lighting, light_rays
    seed=637316554
    inference steps=30

    cowboy_shot, too many flowers,loli,alice,elementary school student girl turning around with white marble glowing skin and dot nose and perfect symmetrical pretty face with blush cheeks,hair ornament, standing in the alice in wonderland, Genshin_Impact,azur_lane,blue_archive,arknights jewelry,glint, sparkle, light_rays lens_flare light_particles, hyper detailed, high detail, exquisite detail, golden hour lighting, strong rim light, intense shadows, bokeh<br/>seed=922722266<br/>inference steps=10

    cowboy_shot, too many flowers,loli,alice,elementary school student girl turning around with white marble glowing skin and dot nose and perfect symmetrical pretty face with blush cheeks,hair ornament, standing in the alice in wonderland, Genshin_Impact,azur_lane,blue_archive,arknights jewelry,glint, sparkle, light_rays lens_flare light_particles, hyper detailed, high detail, exquisite detail, golden hour lighting, strong rim light, intense shadows, bokeh
    seed=922722266
    inference steps=10

    seed=34171926<br/>inference steps=8<br/><br/>prompt<br/>extremely detailed, a chibi, girl with white marble glowing skin and dot nose and perfect symmetrical pretty face with blush cheeks, wavy hair slight smile pretty eyes with catchlight perfect oval iris, elegant dress with many frills, a crown on the head, gold accessories, jewelry, glint, light rays standing in castle with many flowers<br/><br/>negative prompt<br/>deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

    seed=34171926
    inference steps=8

    prompt
    extremely detailed, a chibi, girl with white marble glowing skin and dot nose and perfect symmetrical pretty face with blush cheeks, wavy hair slight smile pretty eyes with catchlight perfect oval iris, elegant dress with many frills, a crown on the head, gold accessories, jewelry, glint, light rays standing in castle with many flowers

    negative prompt
    deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

    beautiful kawaii 1girl with bare_shoulders blue_dress and black_choker, hair ornament of Silver flower, underwater, looking_at_viewer, full_body, breasts, cleavage, aqua_eyes, silver very_long_hair, parted_lips, cowboy_shot, beautiful female face, sparkling anime eyes and elegant eyelashes and perfect symmetrical face fine detail delicate features quiet gaze, intente beautiful light, sharp focus, vloumetric lighting, extremely detailed, official_art, hq, 8k, highres, pixiv ranking 1st<br/>seed=684821328<br/>inference steps=15

    beautiful kawaii 1girl with bare_shoulders blue_dress and black_choker, hair ornament of Silver flower, underwater, looking_at_viewer, full_body, breasts, cleavage, aqua_eyes, silver very_long_hair, parted_lips, cowboy_shot, beautiful female face, sparkling anime eyes and elegant eyelashes and perfect symmetrical face fine detail delicate features quiet gaze, intente beautiful light, sharp focus, vloumetric lighting, extremely detailed, official_art, hq, 8k, highres, pixiv ranking 1st
    seed=684821328
    inference steps=15

    original highly detailed bishojo teens girl under the starlight standing on flower garden. jewelry 1girl perspective, glowing eyes, pale lips, wearing ethnic garment, bokeh, cinematic lighting,<br/>seed=103004710<br/>inference steps=30

    original highly detailed bishojo teens girl under the starlight standing on flower garden. jewelry 1girl perspective, glowing eyes, pale lips, wearing ethnic garment, bokeh, cinematic lighting,
    seed=103004710
    inference steps=30

    8k book cover art of girl, silk dress, lace frills, Platinum blonde wavy long hairstyle, cleavage breasts, white skin, starry eyes, perfect symmetrical face, by krenz cushart and stanley lau and artem demura and alphonse mucha and peter mohrbacher, soft focus, strong rim light, golden hour<br/>seed=78227016<br/>inference steps=8

    8k book cover art of girl, silk dress, lace frills, Platinum blonde wavy long hairstyle, cleavage breasts, white skin, starry eyes, perfect symmetrical face, by krenz cushart and stanley lau and artem demura and alphonse mucha and peter mohrbacher, soft focus, strong rim light, golden hour
    seed=78227016
    inference steps=8

    seed=676040145<br/>inference steps=15<br/><br/>prompt<br/>art by krenz cushart and violet evergarden, navy school suimsuit, shiny wet navy one-piece leotard, view straight on, a loli girl with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing navy school swimsuit in the evening on sunny day standing in beach,  golden hour lighting, strong rim light<br/><br/>negative prompt<br/>2girls, deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs, long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes<br/>スクール水着は生成が難しい。1,000 枚以上作成して一番良かったものがこれ

    seed=676040145
    inference steps=15

    prompt
    art by krenz cushart and violet evergarden, navy school suimsuit, shiny wet navy one-piece leotard, view straight on, a loli girl with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing navy school swimsuit in the evening on sunny day standing in beach, golden hour lighting, strong rim light

    negative prompt
    2girls, deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs, long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes
    スクール水着は生成が難しい。1,000 枚以上作成して一番良かったものがこれ

    art by krenz cushart and violet_evergarden, a beautiful detailed bust shot of woman bathing wearing luxury lingerie bodysuit,jewelry, wedding veil, lace gloves, ring, tiala, neckless, earrings, blesslet, anklet from Tiffany & Co, louis comfort tiffany, garterbelt,Stocking in the romantic Outdoor very big bathtub with bloomed-white-flowers, in the bright heavenly realm room, atmospheric lighting, Strong Sunlight shining through the window, Perfectly shaded, highly detailed, concept art, sharp focus, cinematic lighting, 8k<br/>seed=684889441<br/>inference steps=15<!--Face-centered bust-up compositions. A beautiful hyper detailed huge busty bathing * wearing luxury lingerie bodysuit,garterbelt,Stocking in the romantic Outdoor very big bathtub with bloomed-white-flowers, in the Very bright heavenly realm room, Strong Sunlight shining through the window, painted by *. She is wearing a lot of jewelry, veil, wedding veil, lace gloves, ring, tiala, neckless, earrings, blesslet, anklet from Tiffany & Co, louis comfort tiffany. Perfectly shaded, atmospheric lighting, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, cinematic lighting, 8k, 4k HD. style of raphael lacoste, louis comfort tiffany. painted by *-->

    art by krenz cushart and violet_evergarden, a beautiful detailed bust shot of woman bathing wearing luxury lingerie bodysuit,jewelry, wedding veil, lace gloves, ring, tiala, neckless, earrings, blesslet, anklet from Tiffany & Co, louis comfort tiffany, garterbelt,Stocking in the romantic Outdoor very big bathtub with bloomed-white-flowers, in the bright heavenly realm room, atmospheric lighting, Strong Sunlight shining through the window, Perfectly shaded, highly detailed, concept art, sharp focus, cinematic lighting, 8k
    seed=684889441
    inference steps=15

    seed=888299913<br/>inference steps=15<br/><br/>prompt<br/>2girl, two bishojo snuggled up selfie, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform, golden hour lighting, strong rim light, intense shadows<br/><br/>negative prompt<br/>1girl, solo, deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

    seed=888299913
    inference steps=15

    prompt
    2girl, two bishojo snuggled up selfie, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform, golden hour lighting, strong rim light, intense shadows

    negative prompt
    1girl, solo, deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

    seed=592525032<br/>inference steps=15<br/><br/>prompt<br/>two bishojo embrace each other, 2girl hug each other tight, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform, golden hour lighting, strong rim light, intense shadows, too many flowers<br/><br/>negative prompt<br/>1girl, solo, deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eye

    seed=592525032
    inference steps=15

    prompt
    two bishojo embrace each other, 2girl hug each other tight, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform, golden hour lighting, strong rim light, intense shadows, too many flowers

    negative prompt
    1girl, solo, deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs,long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eye

    seed=722819143<br/>inference steps=8<br/><br/>prompt<br/>hololive, uruha_rushia, 1girl, bangs, bare shoulders, red eyes, blue dress, blue green hair, blue sleeves, blush, bow, breasts, chick, collarbone, detached collar, detached sleeves, double bun, eyebrows visible through hair, frills, hair ornament, medium hair, off-shoulder dress<br/><br/>negative prompt<br/>deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs, long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

    seed=722819143
    inference steps=8

    prompt
    hololive, uruha_rushia, 1girl, bangs, bare shoulders, red eyes, blue dress, blue green hair, blue sleeves, blush, bow, breasts, chick, collarbone, detached collar, detached sleeves, double bun, eyebrows visible through hair, frills, hair ornament, medium hair, off-shoulder dress

    negative prompt
    deformed, bad anatomy, disfigured, mutation, mutated, extra limbs, ugly, fat, missing limb, floating limbs, disconnected limbs, long neck, long body, part of the head, mutated hands and fingers, intricate human hands fingers, poorly drawn hands, malformed hands, poorly drawn face, poorly drawn asymmetrical eyes

    絵下手マンがWaifu Diffusionでファンアートを描く方法

    続・絵下手マンがWaifu Diffusionでファンアートを描く方法 加筆ノウハウ編

    より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて\[StableDiffusion\]

    AI画像生成を利用した着色高速化ワークフロー[NovelAI]

    AIで画像生成してソシャゲのガチャっぽく加工する方法

    画像AIのSDXL+加筆で、手描きに近い白黒漫画を作れないか実験してみた【2】

    漫画

    漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版

    AI漫画制作教程(Pixiv)

    Another experimental workflow for faster comic generation with multiple character and little bit more action (multidiffusion upscaler and controlnet)

    振付

    Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation(Controlnet を経由して1枚絵を動かす)


    カテゴリ